RAG: Retrieval Augmented Generation
Когда и как использовать?
RAG используется, когда LLM отвечает на основе
внутренних документов, а не только своих предобученных
знаний.
Конвейер RAG:
•Разбиение: Документы делятся на фрагменты.
•Эмбеддинги: Векторные представления фрагментов.
•Индекс: Хранение эмбеддингов в векторной БД.
•Извлечение: Получение релевантных фрагментов по запросу.
•Генерация: LLM формирует ответ из извлеченных фрагментов.
Для релевантности: гибридный поиск и переранжирование.
Инструменты: LangChain, LlamaIndex.